摘要。自从 CRISPR-Cas9 问世以来,这项突破性的基因编辑技术可以通过短 RNA 引导序列实现精确的基因组修饰,该技术在各个领域的可及性和应用显著增加。CRISPR-Cas9 的成功刺激了进一步的投资,并导致了更多 CRISPR 系统的发现,包括 CRISPR-Cas13。与针对 DNA 的 Cas9 不同,Cas13 针对 RNA,为基因调控提供了独特的优势。我们专注于 Cas13d,这是一种以其附带活性而闻名的变体,它在激活后会非特异性地切割相邻的 RNA 分子,这是对其功能至关重要的特征。我们介绍了 DeepFM-Crispr,这是一种新型深度学习模型,旨在预测 Cas13d 的靶向效率并评估其脱靶效应。该模型利用大型语言模型生成富含进化和结构数据的综合表示,从而增强对 RNA 二级结构和整体 sgRNA 功效的预测。基于转换器的架构处理这些输入以产生预测功效分数。对比实验表明,DeepFM-Crispr 不仅超越了传统模型,而且在预测准确性和可靠性方面也优于最近最先进的深度学习方法。
主要关键词